AI资讯新闻榜单内容搜索- DeepSeek-

刚刚，DeepSeek V4更新DSpark，推理速度提升80%

刚刚，DeepSeek V4 进行了一次更新。新推出了投机解码（Speculative Decoding）框架 DSpark，并同步开源了支撑该版本的全栈推测性解码框架 DeepSpec。DeepSeek-V4-Pro-DSpark 并非全新架构模型，而是在 DeepSeek-V4-Pro 基础上引入了推测性解码模块。此次更新的重点在于工程落地，而非模型能力本身的迭代。

来自主题: AI技术研报

9207 点击 2026-06-27 18:55

DeepSeek V4做数学证明，500倍成本优势：智能体系统刷新多项纪录

近日，普林斯顿大学的研究团队发布了一篇新论文，提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型，是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报

8616 点击 2026-06-07 10:56

告别多奖励跷跷板：Flow-OPD将多教师OPD带入图像生成

今年以来，在线策略蒸馏 OPD（On-Policy Distillation）已经逐渐成为大厂 LLM 后训练中的重要组件，例如 DeepSeek-V4，GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力，相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报

7312 点击 2026-05-26 10:07

ICLR 2026 Oral｜大模型总爱「想太多」？ DECS从源头消除冗余思考，实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6808 点击 2026-05-12 14:31

GRPO遭遇瓶颈？G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们，或许都曾面临一个共同的困扰：当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型（SLMs）时，效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著，但一旦应用到 1.7B 甚至更小参数的模型上，性能提升就微乎其微。

来自主题: AI技术研报

8574 点击 2026-05-07 10:16

智源：FlagOS完成DeepSeekV4八款芯片Day0 适配，实现三重技术突破

由智源研究院牵头研发的众智 FlagOS 第一时间对两个“巨无霸”模型进行全量适配，已经完成 DeepSeek-V4-Flash 在8款以上 AI 芯片上的全量适配与推理部署，包括海光、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数、英伟达（FP8）等芯片。FlagOS 同时正在推进 DeepSeek-V4-Pro 模型在多个芯片的迁移适配，晚些时间开源出来，敬请期待。

来自主题: AI资讯

8519 点击 2026-04-24 16:23

DeepSeek-V4 预览版：迈入百万上下文普惠时代

今天，我们全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本：

来自主题: AI资讯

9253 点击 2026-04-24 11:20

DeepSeek核心研究员郭达雅，曝入职字节

刚刚，图灵联合创始人刘江在海外社交媒体X上透露，DeepSeek核心研究院——郭达雅已加入字节跳动。郭达雅2023年博士毕业后加入DeepSeek，title是AI Researcher。公开论文显示，从 DeepSeek-Coder、DeepSeek-Math、DeepSeek-Prover、DeepSeek-V3到 DeepSeek-R1，他都出现在核心作者名单中。

来自主题: AI资讯

8738 点击 2026-04-16 08:00

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

2025 年 1 月 20 日，DeepSeek 发布了推理大模型 DeepSeek-R1，在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。研究者发现，在数学推理等具有明确答案的任务

来自主题: AI技术研报

7326 点击 2026-02-08 11:52

刚刚，DeepSeek又探索新架构了，开源OCR 2

嘿！刚刚，DeepSeek 又更新了！这次是更新了十月份推出的 DeepSeek-OCR 模型。刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构，实现了视觉编码从「固定扫描」向「语义推理」的范式转变！

来自主题: AI资讯

9991 点击 2026-01-27 17:15